ارائه یک روش جدید برای تخمین مقادیر گمشده در مجموعه داده

Authors

Abstract:

اغلب مجموعه داده های مربوط به داده کاوی و ماشین یادگیری دارای داده هایی با مقادیر Missing Values یا داده گمشده می باشند. چگونگی برخورد با داده گمشده و نیز ارائه راهکارهایی مبتنی بر تخمین مقدار مربوط به داده گمشده، منجر به بروز یک مسئله بسیار مهم در زمینه داده کاوی و ماشین یادگیری  شده است. در بین الگوریتم های داده کاوی، الگوریتم C4.5، به دلیل کارآیی، استفاده در کاربردهای مختلف داده کاوی و نیز توانایی در کار کردن و تخمین مقدار داده گمشده در مجموعه داده ها، به طور مکرر مورد استفاده قرار گرفته است. پژوهشگران و محققان روش ها و الگوهای متعددی جهت برخورد با مقادیر داده گمشده و تخمین مقدار آن در مجموعه داده های الگوریتم C4.5 ارائه داده اند که هر یک از روش ها به نحوی موجب افزایش دقت درخت تصمیم و در نتیجه تولید یک درخت تصمیم موثر و کاراتر شده است. لذا در مقاله حاضر ابتدا به بررسی و مرور روش ها و راهکارهای ارائه شده پیشین و سپس به ارائه روش پیشنهادی با عنوان روش جابجایی خصوصیت ها جهت تخمین مقادیر گمشده در مجموعه داده پرداخته خواهد شد و سپس در پایان به مقایسه و ارزیابی دقت حاصل شده روش پیشنهادی با روش های حذف و میانگین خواهیم پرداخت.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائه یک روش پیشنهادی برای تخمین مهاجرت داخلی بر پایه داده های رسمی

پیش زمینه: هدف از این مطالعه بررسی میزان دقت روشهای تخمینی مهاجرت داخلی بر اساس داده های رسمی موجود در بانک های اطلاعاتی است که دولت توانایی دسترسی و مدیریت بر آنها را دارد و پیشنهاد کارهایی به منظور تحمین های دقیق مهاجرت داخلی یک پارچه با قابلیت جزء نگری تا سطح شهرستان. مواد و روش ها: این یک مطالعه نمونه ای روی مهاجرانی که در محدوه سالهای 1385 تا 1390 به یکی از نقاط استان یزد مهاجرت داشته اند...

full text

ارائه یک روش جدید برای آنالیز مقاومت پاسخ بازیهای با مقادیر سود تقریبی

معمولاً هنگام استفاده از تئوری بازی ها برای حل مسائل تصمیم گیری دنیای واقعی، مقادیر سود بازیها با تقریب و عدم قطعیت همراه هستند. اما بررسی مراجع نشان می دهد که تا کنون کار چندانی در زمینه آنالیز مقاومت پاسخ بازیهای با سود تقریبی و مشاهده رفتار این پاسخها در حضور عدم قطعیت انجام نشده است. در این مقاله دو معیار ساده برای ارزیابی مقاومت نقاط نش ارائه خواهیم داد. با استفاده از این معیارها، می توان ر...

full text

ارائه یک روش جدید برای آنالیز مقاومت پاسخ بازیهای با مقادیر سود تقریبی

معمولاً هنگام استفاده از تئوری بازی ها برای حل مسائل تصمیم گیری دنیای واقعی، مقادیر سود بازیها با تقریب و عدم قطعیت همراه هستند. اما بررسی مراجع نشان می دهد که تا کنون کار چندانی در زمینه آنالیز مقاومت پاسخ بازیهای با سود تقریبی و مشاهده رفتار این پاسخها در حضور عدم قطعیت انجام نشده است. در این مقاله دو معیار ساده برای ارزیابی مقاومت نقاط نش ارائه خواهیم داد. با استفاده از این معیارها، می توان ر...

full text

ارائه یک روش جدید برای تخمین خواص مخزن با استفاده از آماره‌های فرکتال در یکی از مخازن نفتی‌ایران

توصیف صحیح ناهمگنی‌های خواص مخزن(تخلخل، درجة اشباع آب ونفوذپذیری) نقش مهمی‌در پیش‌بینی درست تولید هیدروکربن در مخازن زیرزمینی دارد. متاسفانه نمی‌توان تنها با چند چاه اکتشافی توزیعات و ناهمگنی‌های خواص مخزن را در مقیاس بزرگ حجم مخزن شناخت. در چنین مواردی یکی از روش‌های بسیار مؤثر و جدید در توصیف و شناسایی توزیعات خواص مخازن در صورت نا کار آمدی روش‌های زمین آماری، استفاده از روش‌های فرکتالی است. ...

full text

ارائه یک مدل جدید جهت تخمین تلاش لازم برای توسعه سرویس های نرم افزاری

تخمین دقیق تلاش لازم برای توسعه سرویس‌های نرم افزاری یک چالش بزرگ هم در صنعت و هم برای محققین است. مفهوم تلاش یک پارامتر مهم و تأثیرگذار در فرآیند توسعه و مدیریت سرویس‌های نرم افزاری است. تخمین دقیق تلاش به مدیران پروژه کمک می‌کند تا منابع را بهتر تخصیص دهند و هزینه و زمان را طوری مدیریت کنند که پروژه در وقت و بودجه تعیین شده به اتمام برسد. یکی از مشهورترین روش‌های تخمین تلاش، استفاده از قیاس و...

full text

ارائه یک روش جدید دو مرحله ای جهت تخمین هوشمند سن افراد

Intelligent age estimation via face images has become an important research topic in machine vision and pattern recognition fields because it has a key role in many applications such as customer behavior analysis in a business intelligence system. Age estimation is a process which analyses an individual face image and estimates his/her age based on the year measure. The age estimation process ...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 16  issue 55

pages  13- 13

publication date 2018-12-22

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023